class: center, middle, inverse, title-slide # Visualizando datos con el paquete ggplot2 ## Big Data e Inteligencia Territorial --- <style type="text/css"> .remark-slide-content { font-size: 25px; padding: 1em 1em 1em 1em; } <style type="text/css"> .remark-code{ line-height: 1.5; font-size: 80% } @media print { .has-continuation { display: block; } } </style> </style> --- class: inverse, middle, center # ¿Por qué visualizar? <html> <div style='float:left'></div> <hr color='#EB811B' size=1px width=1125px> </html> --- # ¿Por qué visualizar? <br> - _"La visualización es el proceso de hacer visibles los contrastes, ritmos y eventos que los datos expresan, que no podemos percibir cuando vienen en forma de áridas listas de números y categorías."_ [^1] <br> - Interpretar / decodificar la información de forma visual <br> [^1]: https://bitsandbricks.github.io/ciencia_de_datos_gente_sociable/visualizacion.html --- class: middle, center, inverse <img src="data:image/png;base64,#C:/Users/pablo/Documents/Pablo/Cursos R/R+BigData/4_visualizacion/img/ggplot_icon.png" width="20%" style="display: block; margin: auto;" /> _<p style="color:grey;" align:"center">Una forma de visualizar</p>_ --- class: inverse, middle, center # ¿Qué es [ggplot2](https://ggplot2.tidyverse.org/)? <html> <div style='float:left'></div> <hr color='#EB811B' size=1px width=1125px> </html> --- # __¿Qué es ggplot2?__ <br> - ### Una implementación del sistema **Grammar of graphics** <br> -- - ### Un esquema pensado en capas (datos --> plano (ejes **x** e **y**) --> geometrías) <br> -- - ### Un paquete de funciones de aplicación intuitiva. --- # Hoja de ruta ## ✔️ ggplot ☑️️ `operador + (nos va a permitir incorporar capas -como lo hacía el pipe %>%-) ` ☑️️ `geom_histogram()` ☑️️ `geom_boxplol()` ☑️️ `geom_col()` ☑️️ `chapa y pintura (Atributos)` *** ```r base_covid <- read.table("entradas/base_covid_muestra.txt", sep = ",", header = T, fileEncoding = "UTF-8") ``` --- # ggplot() <img src="data:image/png;base64,#C:/Users/pablo/Documents/Pablo/Cursos R/R+BigData/4_visualizacion/img/ggplot2_esquema.png" width="70%" style="display: block; margin: auto;" /> --- class: inverse, middle, center # __geom_histogram()__ <html> <div style='float:left'></div> <hr color='#EB811B' size=1px width=1125px> </html> --- # geom_histogram() - **Caso:** Quiero conocer la distribución de la población según su edad: --- # Capas del gráfico - insumo(dataframe) .pull-left[ ```r ggplot(`data = base_covid`) ``` <br> - **¿De donde saco las variables?** ] .pull-right[ <!-- --> ] --- # Capas del gráfico - coordenadas .pull-left[ ```r ggplot(data = base_covid, `mapping = aes(x = edad))` ``` <br> - **¿Qué variables? ¿Cómo me las imagino en el gráfico?** ] .pull-right[ <!-- --> ] --- # Capas del gráfico - geometría .pull-left[ ```r ggplot(data = base_covid, mapping = aes(x = edad)) + `geom_histogram() ` ``` <br> - **¿Qué tipo de gráfico quiero hacer?** ] .pull-right[ <!-- --> ] --- # Chapa y pintura (Atributos) <br><br> ☑️️ `fill()` (_Rellenar_) ☑️️ `colour()` (_colorear_) ☑️️ `alpha` (_transparencia_) --- .pull-left[ ```r ggplot(data = base_covid, mapping = aes(x = edad)) + geom_histogram(`fill = "salmon"`) ``` <br> - **Relleno** ] .pull-right[ <!-- --> ] --- .pull-left[ ```r ggplot(data = base_covid, mapping = aes(x = edad)) + geom_histogram(fill = "salmon", `colour = "black"`) ``` <br> - **Contorno** ] .pull-right[ <!-- --> ] --- .pull-left[ ```r ggplot(data = base_covid, mapping = aes(x = edad)) + geom_histogram(fill = "salmon", colour = "black", `alpha = 0.5`) ``` <br> - **Transparencia** ] .pull-right[ <!-- --> ] --- class: inverse, middle, center # _PRÁCTICA_ <html> <div style='float:left'></div> <hr color='#EB811B' size=1px width=1125px> </html> --- class: inverse, middle # Práctica 1) Importar la base covid_muestra. 2) El siguiente código debería realizar un histograma. Para ello hace falta completar aquellos espacios con ______ y ejecutarlo: ```r ggplot(data = ______, mapping = aes(x = edad)) ______ geom______ (fill = ______, colour = "black", alpha = 0.5) ``` 3) Replicar el código anterior y modificar los valores de los atributos a gusto --- class: inverse, middle, center # __geom_col()__ <html> <div style='float:left'></div> <hr color='#EB811B' size=1px width=1125px> </html> --- # geom_col() **Caso:** Quiero visualizar la diferencia entre la edad media de aquellas personas que recibieron asistencia respiratoria y aquellas que no: -- ```r summary(base_covid$edad) ``` ``` Min. 1st Qu. Median Mean 3rd Qu. Max. NA's -12.00 26.00 37.00 39.08 50.00 121.00 92 ``` -- ```r base_covid %>% filter(edad == 0) %>% count() ``` ``` # A tibble: 1 x 1 n <int> 1 2 ``` --- # geom_col() - **Paso 2.** *Limpiar* la variable: ```r tabla_edad <- base_covid %>% rename(asistencia_mec = asistencia_respiratoria_mecanica) %>% filter(!is.na(asistencia_mec) & edad >= 0) %>% group_by(asistencia_mec) %>% summarise(edad_media = mean(edad, na.rm = TRUE)) %>% mutate(edaD_media = round(edad_media, digits = 0)) ``` -- ``` # A tibble: 2 x 3 asistencia_mec edad_media edaD_media <chr> <dbl> <dbl> 1 NO 39.0 39 2 SI 62.6 63 ``` --- count: false # geom_col .panel1-geom_col-auto[ ```r *ggplot(data = tabla_edad, * mapping = aes(x = asistencia_mec, * y = edad_media)) ``` ] .panel2-geom_col-auto[ <!-- --> ] --- count: false # geom_col .panel1-geom_col-auto[ ```r ggplot(data = tabla_edad, mapping = aes(x = asistencia_mec, y = edad_media)) + * geom_col() ``` ] .panel2-geom_col-auto[ <!-- --> ] <style> .panel1-geom_col-auto { color: black; width: 55.5333333333333%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-geom_col-auto { color: black; width: 42.4666666666667%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-geom_col-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- count: false # geom_col - relleno .panel1-geom_col_1-auto[ ```r *ggplot(data = tabla_edad, * mapping = aes(x = asistencia_mec, * y = edad_media)) ``` ] .panel2-geom_col_1-auto[ <!-- --> ] --- count: false # geom_col - relleno .panel1-geom_col_1-auto[ ```r ggplot(data = tabla_edad, mapping = aes(x = asistencia_mec, y = edad_media)) + * geom_col(fill = c("green", "red")) ``` ] .panel2-geom_col_1-auto[ <!-- --> ] <style> .panel1-geom_col_1-auto { color: black; width: 55.5333333333333%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-geom_col_1-auto { color: black; width: 42.4666666666667%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-geom_col_1-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- count: false # geom_col - Contorno + Transparencia .panel1-geom_col_2-auto[ ```r *ggplot(data = tabla_edad, * mapping = aes(x = asistencia_mec, * y = edad_media)) ``` ] .panel2-geom_col_2-auto[ <!-- --> ] --- count: false # geom_col - Contorno + Transparencia .panel1-geom_col_2-auto[ ```r ggplot(data = tabla_edad, mapping = aes(x = asistencia_mec, y = edad_media)) + * geom_col(aes(fill = asistencia_mec), * colour = "black", * alpha = 0.7) ``` ] .panel2-geom_col_2-auto[ <!-- --> ] <style> .panel1-geom_col_2-auto { color: black; width: 55.5333333333333%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-geom_col_2-auto { color: black; width: 42.4666666666667%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-geom_col_2-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- class: inverse, middle, center # __chapa y pintura__ <html> <div style='float:left'></div> <hr color='#EB811B' size=1px width=1125px> </html> --- count: false # geom_col .panel1-geom_col_3-auto[ ```r *ggplot(data = tabla_edad, * mapping = aes(x = asistencia_mec, * y = edad_media)) ``` ] .panel2-geom_col_3-auto[ <!-- --> ] --- count: false # geom_col .panel1-geom_col_3-auto[ ```r ggplot(data = tabla_edad, mapping = aes(x = asistencia_mec, y = edad_media)) + * geom_col(aes(fill = asistencia_mec), * colour = "black", * alpha = 0.7) ``` ] .panel2-geom_col_3-auto[ <!-- --> ] --- count: false # geom_col .panel1-geom_col_3-auto[ ```r ggplot(data = tabla_edad, mapping = aes(x = asistencia_mec, y = edad_media)) + geom_col(aes(fill = asistencia_mec), colour = "black", alpha = 0.7) + * labs(title = "Este es el título del gráfico", * subtitle = "Y este, el subtítulo", * x = "Acá puedo editar texto de eje x", * y = "y acá texto de eje y", * fill = "leyenda? Por supuesto, acá") ``` ] .panel2-geom_col_3-auto[ <!-- --> ] --- count: false # geom_col .panel1-geom_col_3-auto[ ```r ggplot(data = tabla_edad, mapping = aes(x = asistencia_mec, y = edad_media)) + geom_col(aes(fill = asistencia_mec), colour = "black", alpha = 0.7) + labs(title = "Este es el título del gráfico", subtitle = "Y este, el subtítulo", x = "Acá puedo editar texto de eje x", y = "y acá texto de eje y", fill = "leyenda? Por supuesto, acá") + * geom_text(aes(label = round(edad_media))) ``` ] .panel2-geom_col_3-auto[ <!-- --> ] --- count: false # geom_col .panel1-geom_col_3-auto[ ```r ggplot(data = tabla_edad, mapping = aes(x = asistencia_mec, y = edad_media)) + geom_col(aes(fill = asistencia_mec), colour = "black", alpha = 0.7) + labs(title = "Este es el título del gráfico", subtitle = "Y este, el subtítulo", x = "Acá puedo editar texto de eje x", y = "y acá texto de eje y", fill = "leyenda? Por supuesto, acá") + geom_text(aes(label = round(edad_media))) + * theme_minimal() ``` ] .panel2-geom_col_3-auto[ <!-- --> ] <style> .panel1-geom_col_3-auto { color: black; width: 42.4666666666667%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-geom_col_3-auto { color: black; width: 55.5333333333333%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-geom_col_3-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- # Orden de las categorías - Para darle orden a las categorías en un eje podemos recurrir al tipo de variable **factor**. -- - Los factores en R son variables categóricas (o llamadas "cualitativas"). -- - Además, otra propiedad de las variables de tipo **factor** es la ordinalidad (no es indistinto el orden de aparición). Por ejemplo, variables como *nivel educativo* o *grado de satisfacción* son variabes que (números o texto), son categóricas y ordinales. --- # Orden de las categorías ```r edad <- c(24,54,75,25,65,12) sexo_num <- c(1, 2, 2, 2, 1, 2) sexo_text <- c("hombre", "mujer", "mujer", "mujer", "hombre", "mujer") base <- data.frame(edad, sexo_num, sexo_text) ``` ```r class(base$sexo_num) ``` ``` [1] "numeric" ``` -- ```r class(base$sexo_text) ``` ``` [1] "character" ``` --- # Orden de las categorías - Convertimos en factor a la variable _sexo_num_ ```r base <- base %>% mutate(sexo_factor = factor(sexo_num, levels = c(1, 2))) base %>% count(sexo_factor) ``` ``` sexo_factor n 1 1 2 2 2 4 ``` -- - **¿Qué pasa si invierto el orden de los niveles (categorías) en el parámetro `level = `?** --- count: false # geom_col + factor .panel1-geom_col_4-auto[ ```r *tabla_edad ``` ] .panel2-geom_col_4-auto[ ``` # A tibble: 2 x 2 asistencia_mec edad_media <chr> <dbl> 1 NO 39.0 2 SI 62.6 ``` ] --- count: false # geom_col + factor .panel1-geom_col_4-auto[ ```r tabla_edad %>% * mutate(asistencia_mec = factor(asistencia_mec, * levels = c("SI", "NO"))) ``` ] .panel2-geom_col_4-auto[ ``` # A tibble: 2 x 2 asistencia_mec edad_media <fct> <dbl> 1 NO 39.0 2 SI 62.6 ``` ] --- count: false # geom_col + factor .panel1-geom_col_4-auto[ ```r tabla_edad %>% mutate(asistencia_mec = factor(asistencia_mec, levels = c("SI", "NO"))) %>% * ggplot(mapping = aes(x = asistencia_mec, * y = edad_media)) ``` ] .panel2-geom_col_4-auto[ <!-- --> ] --- count: false # geom_col + factor .panel1-geom_col_4-auto[ ```r tabla_edad %>% mutate(asistencia_mec = factor(asistencia_mec, levels = c("SI", "NO"))) %>% ggplot(mapping = aes(x = asistencia_mec, y = edad_media)) + * geom_col(aes(fill = asistencia_mec), * colour = "black", * alpha = 0.7) ``` ] .panel2-geom_col_4-auto[ <!-- --> ] --- count: false # geom_col + factor .panel1-geom_col_4-auto[ ```r tabla_edad %>% mutate(asistencia_mec = factor(asistencia_mec, levels = c("SI", "NO"))) %>% ggplot(mapping = aes(x = asistencia_mec, y = edad_media)) + geom_col(aes(fill = asistencia_mec), colour = "black", alpha = 0.7) + * labs(title = "Edad media de la población según perceptción de asistencia respiratoria mecánica", * subtitle = "Año 2020-2021.", * x = "Asistencia respiratoria mecánica", * y = "Edad media", * fill = "Asistencia médica") ``` ] .panel2-geom_col_4-auto[ <!-- --> ] --- count: false # geom_col + factor .panel1-geom_col_4-auto[ ```r tabla_edad %>% mutate(asistencia_mec = factor(asistencia_mec, levels = c("SI", "NO"))) %>% ggplot(mapping = aes(x = asistencia_mec, y = edad_media)) + geom_col(aes(fill = asistencia_mec), colour = "black", alpha = 0.7) + labs(title = "Edad media de la población según perceptción de asistencia respiratoria mecánica", subtitle = "Año 2020-2021.", x = "Asistencia respiratoria mecánica", y = "Edad media", fill = "Asistencia médica") + * geom_text(aes(label = round(edad_media)), * vjust = -0.5) ``` ] .panel2-geom_col_4-auto[ <!-- --> ] --- count: false # geom_col + factor .panel1-geom_col_4-auto[ ```r tabla_edad %>% mutate(asistencia_mec = factor(asistencia_mec, levels = c("SI", "NO"))) %>% ggplot(mapping = aes(x = asistencia_mec, y = edad_media)) + geom_col(aes(fill = asistencia_mec), colour = "black", alpha = 0.7) + labs(title = "Edad media de la población según perceptción de asistencia respiratoria mecánica", subtitle = "Año 2020-2021.", x = "Asistencia respiratoria mecánica", y = "Edad media", fill = "Asistencia médica") + geom_text(aes(label = round(edad_media)), vjust = -0.5) + * theme_minimal() ``` ] .panel2-geom_col_4-auto[ <!-- --> ] <style> .panel1-geom_col_4-auto { color: black; width: 42.4666666666667%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-geom_col_4-auto { color: black; width: 55.5333333333333%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-geom_col_4-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- class: inverse, middle, center # _PRÁCTICA_ <html> <div style='float:left'></div> <hr color='#EB811B' size=1px width=1125px> </html> --- class: inverse, middle # Práctica - Dado el siguiente código que devuelve la cantidad de casos para las provincias seleccionadas, responder **visualmente** a la pregunta: ¿Cuál es la provincia que registra más casos?: ```r tabla_provincia <- base_covid %>% rename(provincia = residencia_provincia_nombre) %>% filter(provincia %in% c("San Luis", "San Juan", "Santiago del Estero")) %>% count(provincia) ``` 1. Hacer un gráfico de barras que muestre la cantidad de casos por provincia 1. Agregarle **color** a las barras en base a la variable **provincia** 1. Agregarle los textos de: **Titulo**, **Ejes x e y**, **Leyenda**. --- count: false # geom_col + faceteado + flipeo .panel1-geom_col_5-auto[ ```r *base_covid ``` ] .panel2-geom_col_5-auto[ ``` # A tibble: 182,680 x 25 id_evento_caso sexo edad edad_años_meses residencia_pais_~ residencia_prov~ <dbl> <chr> <dbl> <chr> <chr> <chr> 1 748361 NR 23 Años Líbano SIN ESPECIFICAR 2 748780 F 53 Años Argentina CABA 3 751658 M 44 Años Argentina CABA 4 755897 F 29 Años Argentina CABA 5 756503 M 54 Años Argentina CABA 6 758578 M 2 Años Argentina CABA 7 762704 M 41 Años Argentina CABA 8 763097 M 53 Años Argentina CABA 9 764087 F 70 Años Argentina CABA 10 765127 M 30 Años Argentina CABA # ... with 182,670 more rows, and 19 more variables: # residencia_departamento_nombre <chr>, carga_provincia_nombre <chr>, # fecha_inicio_sintomas <date>, fecha_apertura <date>, sepi_apertura <dbl>, # fecha_internacion <date>, cuidado_intensivo <chr>, # fecha_cui_intensivo <lgl>, fallecido <chr>, fecha_fallecimiento <date>, # asistencia_respiratoria_mecanica <chr>, carga_provincia_id <chr>, # origen_financiamiento <chr>, clasificacion <chr>, # clasificacion_resumen <chr>, residencia_provincia_id <chr>, # fecha_diagnostico <date>, residencia_departamento_id <chr>, # ultima_actualizacion <date> ``` ] --- count: false # geom_col + faceteado + flipeo .panel1-geom_col_5-auto[ ```r base_covid %>% * rename(provincia = residencia_provincia_nombre) ``` ] .panel2-geom_col_5-auto[ ``` # A tibble: 182,680 x 25 id_evento_caso sexo edad edad_años_meses residencia_pais_nom~ provincia <dbl> <chr> <dbl> <chr> <chr> <chr> 1 748361 NR 23 Años Líbano SIN ESPECIFI~ 2 748780 F 53 Años Argentina CABA 3 751658 M 44 Años Argentina CABA 4 755897 F 29 Años Argentina CABA 5 756503 M 54 Años Argentina CABA 6 758578 M 2 Años Argentina CABA 7 762704 M 41 Años Argentina CABA 8 763097 M 53 Años Argentina CABA 9 764087 F 70 Años Argentina CABA 10 765127 M 30 Años Argentina CABA # ... with 182,670 more rows, and 19 more variables: # residencia_departamento_nombre <chr>, carga_provincia_nombre <chr>, # fecha_inicio_sintomas <date>, fecha_apertura <date>, sepi_apertura <dbl>, # fecha_internacion <date>, cuidado_intensivo <chr>, # fecha_cui_intensivo <lgl>, fallecido <chr>, fecha_fallecimiento <date>, # asistencia_respiratoria_mecanica <chr>, carga_provincia_id <chr>, # origen_financiamiento <chr>, clasificacion <chr>, # clasificacion_resumen <chr>, residencia_provincia_id <chr>, # fecha_diagnostico <date>, residencia_departamento_id <chr>, # ultima_actualizacion <date> ``` ] --- count: false # geom_col + faceteado + flipeo .panel1-geom_col_5-auto[ ```r base_covid %>% rename(provincia = residencia_provincia_nombre) %>% * filter(provincia %in% c("San Luis", "San Juan", "Santiago del Estero")) ``` ] .panel2-geom_col_5-auto[ ``` # A tibble: 8,302 x 25 id_evento_caso sexo edad edad_años_meses residencia_pais_no~ provincia <dbl> <chr> <dbl> <chr> <chr> <chr> 1 923273 M 46 Años Argentina San Luis 2 2719838 M 46 Años Argentina San Luis 3 2932651 M 38 Años Argentina San Juan 4 2955548 M 72 Años Argentina San Juan 5 2957124 M 72 Años Argentina San Juan 6 3099994 M 26 Años Argentina San Juan 7 3132693 M 33 Años Argentina San Juan 8 7603084 F 21 Años Argentina Santiago del ~ 9 9961441 F 25 Años Argentina San Luis 10 807392 M 34 Años Argentina San Luis # ... with 8,292 more rows, and 19 more variables: # residencia_departamento_nombre <chr>, carga_provincia_nombre <chr>, # fecha_inicio_sintomas <date>, fecha_apertura <date>, sepi_apertura <dbl>, # fecha_internacion <date>, cuidado_intensivo <chr>, # fecha_cui_intensivo <lgl>, fallecido <chr>, fecha_fallecimiento <date>, # asistencia_respiratoria_mecanica <chr>, carga_provincia_id <chr>, # origen_financiamiento <chr>, clasificacion <chr>, # clasificacion_resumen <chr>, residencia_provincia_id <chr>, # fecha_diagnostico <date>, residencia_departamento_id <chr>, # ultima_actualizacion <date> ``` ] --- count: false # geom_col + faceteado + flipeo .panel1-geom_col_5-auto[ ```r base_covid %>% rename(provincia = residencia_provincia_nombre) %>% filter(provincia %in% c("San Luis", "San Juan", "Santiago del Estero")) %>% * count(provincia, sexo) ``` ] .panel2-geom_col_5-auto[ ``` # A tibble: 9 x 3 provincia sexo n <chr> <chr> <int> 1 San Juan F 787 2 San Juan M 807 3 San Juan NR 15 4 San Luis F 2156 5 San Luis M 1926 6 San Luis NR 9 7 Santiago del Estero F 1239 8 Santiago del Estero M 1317 9 Santiago del Estero NR 46 ``` ] --- count: false # geom_col + faceteado + flipeo .panel1-geom_col_5-auto[ ```r base_covid %>% rename(provincia = residencia_provincia_nombre) %>% filter(provincia %in% c("San Luis", "San Juan", "Santiago del Estero")) %>% count(provincia, sexo) %>% * ggplot(mapping = aes(x = provincia, * y = n)) ``` ] .panel2-geom_col_5-auto[ <!-- --> ] --- count: false # geom_col + faceteado + flipeo .panel1-geom_col_5-auto[ ```r base_covid %>% rename(provincia = residencia_provincia_nombre) %>% filter(provincia %in% c("San Luis", "San Juan", "Santiago del Estero")) %>% count(provincia, sexo) %>% ggplot(mapping = aes(x = provincia, y = n)) + * geom_col(aes(fill = provincia)) ``` ] .panel2-geom_col_5-auto[ <!-- --> ] --- count: false # geom_col + faceteado + flipeo .panel1-geom_col_5-auto[ ```r base_covid %>% rename(provincia = residencia_provincia_nombre) %>% filter(provincia %in% c("San Luis", "San Juan", "Santiago del Estero")) %>% count(provincia, sexo) %>% ggplot(mapping = aes(x = provincia, y = n)) + geom_col(aes(fill = provincia)) + * theme_minimal() ``` ] .panel2-geom_col_5-auto[ <!-- --> ] --- count: false # geom_col + faceteado + flipeo .panel1-geom_col_5-auto[ ```r base_covid %>% rename(provincia = residencia_provincia_nombre) %>% filter(provincia %in% c("San Luis", "San Juan", "Santiago del Estero")) %>% count(provincia, sexo) %>% ggplot(mapping = aes(x = provincia, y = n)) + geom_col(aes(fill = provincia)) + theme_minimal() + * facet_wrap(facets = "sexo") ``` ] .panel2-geom_col_5-auto[ <!-- --> ] --- count: false # geom_col + faceteado + flipeo .panel1-geom_col_5-auto[ ```r base_covid %>% rename(provincia = residencia_provincia_nombre) %>% filter(provincia %in% c("San Luis", "San Juan", "Santiago del Estero")) %>% count(provincia, sexo) %>% ggplot(mapping = aes(x = provincia, y = n)) + geom_col(aes(fill = provincia)) + theme_minimal() + facet_wrap(facets = "sexo") + * geom_text(aes(label = n), * vjust = -0.25) ``` ] .panel2-geom_col_5-auto[ <!-- --> ] --- count: false # geom_col + faceteado + flipeo .panel1-geom_col_5-auto[ ```r base_covid %>% rename(provincia = residencia_provincia_nombre) %>% filter(provincia %in% c("San Luis", "San Juan", "Santiago del Estero")) %>% count(provincia, sexo) %>% ggplot(mapping = aes(x = provincia, y = n)) + geom_col(aes(fill = provincia)) + theme_minimal() + facet_wrap(facets = "sexo") + geom_text(aes(label = n), vjust = -0.25) + * coord_flip() ``` ] .panel2-geom_col_5-auto[ <!-- --> ] --- count: false # geom_col + faceteado + flipeo .panel1-geom_col_5-auto[ ```r base_covid %>% rename(provincia = residencia_provincia_nombre) %>% filter(provincia %in% c("San Luis", "San Juan", "Santiago del Estero")) %>% count(provincia, sexo) %>% ggplot(mapping = aes(x = provincia, y = n)) + geom_col(aes(fill = provincia)) + theme_minimal() + facet_wrap(facets = "sexo") + geom_text(aes(label = n), vjust = -0.25) + coord_flip() ``` ] .panel2-geom_col_5-auto[ <!-- --> ] <style> .panel1-geom_col_5-auto { color: black; width: 42.4666666666667%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-geom_col_5-auto { color: black; width: 55.5333333333333%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-geom_col_5-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- class: inverse, middle, center # _PRÁCTICA_ <html> <div style='float:left'></div> <hr color='#EB811B' size=1px width=1125px> </html> --- class: inverse, middle # Práctica 2). Identificar el error en la siguiente sentencia, corregirlo y correr el gráfico: ```r tabla_ejercicio <- base_covid %>% rename(provincia = residencia_provincia_nombre) %>% filter(provincia %in% c("Córdoba", "Salta", "La Pampa")) %>% count(provincia, sexo) ggplot(data = provincia, mapping = aes(x = tabla_ejercicio, y = n)) + geom_col(aes(fill = provincia)) + theme_minimal() + facet_wrap(facets = "sexo") + geom_text(aes(label = n), vjust = -0.25) ``` --- class: inverse, middle # Práctica 2). Identificar el error en la siguiente sentencia, corregirlo y correr el gráfico: ```r tabla_ejercicio_2 <- base_covid %>% rename(provincia = residencia_provincia_nombre) %>% filter(provincia %in% c("Córdoba", "Salta", "La Pampa")) %>% count(provincia, origen_financiamiento) %>% group_by(provincia) %>% mutate(peso = round(n / sum(n) * 100, digits = 2)) ggplot(data = tabla_ejercicio_2, mapping = aes(h = origen_financiamiento, y = peso)) + geom_col(aes(relleno = origen_financiamiento)) + facet_wrap(facets = "provincia") + geom_text(aes(label = peso), vjust = -0.25) + theme_minimal() ```